时政
财经
科技
虚拟货币
其他
登录
#AI Agent
关注
Yangyi
6天前
如果去可视化ClaudeCode的工作轨迹 可以看到 AI agent 在真实代码库中浏览、审查结构、做决策并提交修改的过程 软件开发正进入新的阶段,并非传统意义上的自动化,而是Agent能理解上下文、应对复杂情况、并做出有意义贡献的系统。 虽然目前仍处于vibe coding的早期阶段,但这个趋势毋庸置疑:人类和Agents正在进行人机协同的合作来构建未来
Claude Skills系统发布引发AI行业新变革· 46 条信息
#AI Agent
#代码库
#人机协同
#软件开发
#自动化
分享
评论 0
0
向阳乔木
1周前
Vibe Coding可能慢慢会过渡到Agentic Coding。 开发者只需设定目标,例如:“重构这个微服务以提高效率”) AI Agent自主地规划、执行和验证。
#Vibe Coding
#Agentic Coding
#AI Agent
#自动化
#软件开发
分享
评论 0
0
Hubble AI 中文
1周前
错过了 x402 的热潮?别再错过 ERC-8004。 短短几周内,x402 以 “AI Agent能自主支付” 的概念席卷了整个加密圈。 它让机器第一次真正参与经济活动——能为服务付费,也能从交互中获利。 但在支付之外,更关键的问题随之而来: 当无数AI Agent开始彼此调用、交易、合作,它们如何确认对方是谁、是否可信、结果是否真实? 这正是 ERC-8004 诞生的背景。 这个由以太坊基金会、MetaMask、Google 与 Coinbase 工程师共同提出的标准, 正在为Agent Economy补上缺失的那一层:信任层(Trust Layer)。 ERC-8004 的核心机制 ERC-8004 也被称为 “无信任智能体(Trustless Agents)” 标准。 它与 x402 一样,都是构建 AI 经济基础设施的关键拼图: x402 让价值可以流动,而 ERC-8004 让流动变得可信。 它由三项机制组成: - 身份注册(Identity Registry):为每个 Agent 创建可验证的链上身份与元数据。 - 信誉记录(Reputation Registry):每次交互都会留下公开的表现与反馈,形成可追踪的信誉曲线。 - 结果验证(Validation Registry):通过加密证明或第三方审计,确保输出结果真实可验证。 换句话说,ERC-8004 把“信任”从主观判断转化为可被代码读取的数据结构。 重构AI Agent的信任体系 今天的 AI 服务依然依赖中心化平台。 算法、信誉、流量都掌握在少数公司手中。 ERC-8004 则将这些核心要素迁移到链上,让Agent拥有独立的身份与历史记录。 这意味着: 信誉不再属于平台,而属于Agent本身; 表现优秀的 Agent 可以在不同网络中自由流通; 信任成为开放市场中的可定价资源。 当信誉与验证数据都公开后,可靠性本身就能被定价。 好的Agent获得更多调用与收益,失信的则失去交易机会。 这让Agent市场第一次具备了“优胜劣汰”的经济逻辑。 x402 与 ERC-8004 是同一体系的两极: 一个让机器能“付钱”,一个让机器“值得被信任”。 两者共同形成一个自我强化的经济循环: Agent 通过 x402 完成支付; 执行结果经 ERC-8004 验证并上链; 信誉记录自动更新; 价格与优先级据此动态调整。 这不仅让机器之间能合作,更让合作具备市场意义—— 激励、信任、竞争首次在 AI 层实现自治。 正在形成的生态版图 围绕 x402 与 ERC-8004,一个以「支付与信任」为核心的Agent生态正在加速成形。 它大致可以分为三个层次: 1. 基础设施层 以 EigenLayer、Base、Taiko、Phala Network、Celestia 等项目为代表, 它们提供算力、验证与数据可用性, 为Agent的安全运行和交互提供底层支撑。 2. 中间协议层 包括 OpenServ、Unibase、S.A.N.T.A、Bittensor、、SingularityNET 等协议, 负责Agent之间的通信、索引、结算与激励机制, 相当于连接底层链与上层应用的“中枢神经系统”。 3. 应用层 这一层是Agent真正进入市场、创造价值的地方。 例如 Virtuals Protocol、Praxis、Kaito、MyShell 等团队, 正在把交易、数据分析、内容生成等场景变成可调用的Agent服务。 而在这一层中,Hubble 正在构建关键基础设施。 我们将 x402 的支付机制 与 ERC-8004 的信任模型 相结合, 把链上数据、研究逻辑和交易策略封装成可验证的 Agent Marketplace。 通过这一市场,Agent之间能以“真实交易、实时验证”的方式运行, 让信任与价值循环在实际市场中被验证。 结语 ERC-8004 让信任第一次拥有了结构化的形式。 当它与 x402 一起运转,AI Agent不再只是算法模型, 而成为具备身份、信誉与收益能力的独立经济个体。 在未来的网络中, 不仅人类在交易,Agent之间也会因信誉而竞争。 这,才是AI Agent时代真正的开始。
#ERC-8004
#AI Agent
#信任层
#agent economy
#x402
分享
评论 0
0
LysonOber
1周前
🤔 在不同的社区里,我们经常看到人们向他人求助 Dify 的使用方法。有人在 Discord 发问题,有人在 WeChat 群里讨论,也有人在 WhatsApp 或 LINE 上分享经验。🤷 信息在不同地方流动,却很难被追踪或系统地沉淀下来。 🎉 现在,Dify Forum 上线了。 我们希望这是一个能让构建者聚集的地方,无论你是在学习 Dify、在构建 Agent、还是在探索 Workflow,都能在这里发帖、提问、或记录自己的经验。 ☝️ 你不需要下载软件,只需打开网页就能进入讨论。论坛既保留了早期互联网那种有温度的讨论氛围,也结合了 AI 的能力,帮助你自动总结内容、快速检索主题、积累知识。 我们并不希望替代现有的社区,而是让每一次提问都能留下痕迹。无论你平时活跃在哪个平台,都可以先想到把问题发到 ,再把链接分享给群里的朋友,让交流更容易被看到、被持续讨论。 📝 如果你曾经看完官方文档仍然不知道该如何下手,或是想找到更多正在用 Dify 构建 AI 应用的人,那么现在就可以去 逛逛,也许会找到新的思路和伙伴。
#Dify
#Dify Forum
#AI Agent
#Workflow
#社区讨论
分享
评论 0
0
sitin
1周前
Pokee AI 最近推出了一个挺有意思的东西 —— 号称"第一个用自然语言就能构建工作流的 AI Agent"。 和 n8n、Zapier 这些传统自动化工具不一样,你不用拖节点、配 API。直接告诉它要干什么,它自己去执行。 比如"把上周会议纪要总结成 PPT 发给团队",它会自己找文档、生成内容、做幻灯片、发 Slack。整个流程自动跑完。 感觉这个方向挺对的,把 AI 和自动化真正结合起来了。对经常做重复工作的人来说应该会有用。
#Pokee AI
#AI Agent
#自然语言工作流
#自动化
#效率提升
分享
评论 0
0
咖啡猫
1周前
Ai Agent会不会是下一个 版本的 Defi 乐高了? 蓝大说的 x402+ERC-8004+AP2(A2A框架)大概又是啥意思呢? 简单拆解下: x402:一个开放的支付协议,能让AI能瞬间结算。 ERC-8004:AI代理身份层标准,管“身份信任”,确保AI代理是谁,避免上当。 AP2(A2A框架):这个是Google主导的Agent Payments Protocol(代理支付协议),基于A2A(代理间通信)框架,构建标准化支付环境,让AI代理能自己决策交易。 以上协议相互交叉,类似特斯拉的无人驾驶,有AI 喂数据,有机器人 ,有储能系统。相互交叉支撑特斯拉
#多智能体之争:Anthropic生态VS单智能体· 77 条信息
#AI Agent
#DeFi乐高
#支付协议
#ERC-8004
#AP2
分享
评论 0
0
Geek
2周前
GitHubhunt 一个基于 AI Agent 的自然语言 Github 仓库搜索工具。 用户通过自然语言描述需求,AI 将结合内置的搜索能力与工具调用,动态组合输入以精准定位符合条件的 Github 仓库,并可从用户的关注列表中检索相关项目,或对仓库功能进行总结和解释。
#AI Agent
#GitHubhunt
#自然语言搜索
#GitHub仓库
#工具
分享
评论 0
0
熊布朗
2周前
熊布朗的 Deeptoai持续分享系列 - Advanced RAG 教程 —— 我做了一个 Advanced RAG 系列的学习文档,今天正式发布 包含理论、实践和 9 个 RAG 开源项目的深度剖析拆解 完全开放,完全免费 教程地址: ---- 这个教程是标准得面向AI从业者,目标是能服务得了企业级的 RAG 研发,当然产品经理也可以看,可以学。 设计了几个等级 📚 Level 0:新手入门 手把手教你搭建第一个 RAG 系统 从环境配置到完整实现。 📖 Level 1:理论建立 RAG 核心概念、发展历程、技术综述 建立完整的知识框架。 🔬 Level 2:深入原理 核心技术的算法实现和性能调优 向量搜索、Chunking、混合检索、Rerank、查询转换等。 💻 Level 3:动手实践 真实案例、代码实现、工程最佳实践 Milvus 混合检索、多模态 RAG、GraphRAG、Agent RAG 等。 🏗️ Level 4:项目落地 9 个生产级开源项目的深度剖析。 —— 这一层是给需要做技术选型和架构设计的人准备的,我也是这么学过来的,到目前能面向企业交付私有知识库和 AI Agent,基本上面向企业用户,RAG 是必需的。 各位朋友看看,如果有帮助 还请 📢 转发给需要的人 💬 提建议和反馈(私信我)
#RAG教程
#AI从业者
#企业级RAG研发
#知识库
#AI Agent
分享
评论 0
0
fangjun
2周前
x402 现在虽然热闹的是 AI Agent 机器对机器支付的可能性,但我觉得它更为基础,这是推动支付基础设施(payment rail)更新换代的重要一小步。 一个视频解读下最近经常看到的那个对比图表。
#AI Agent
#机器支付
#支付基础设施
#技术更新
#中性
分享
评论 0
0
勃勃OC
2周前
去年apple intelligence刚一推出,我就说,这个傻逼功能离死不远了。 稍微一个沾点ADHD的正常人,整个公司代码都喂给cursor、github copilot、claude code了,整个公司数据全喂给chatgpt了, 隐私核安全在LLM和AI Agent时代,就是个狗屎中的狗屎, 一堆估值几亿几十亿刀的公司,核心代码都用claude code写, 你那点狗屁隐私数据、隐私文件、隐私邮件、隐私代码,能值几个钱?还他妈不愿意让OpenAI和Anthropic看了? 人家OpenAI和Anthropic拿你当人吗?你们公司里面那点破烂玩意儿,往外卖都没人要,用得着OpenAI直接偷吗? 天天意淫本地AI、本地inference、本地GPU推理oss、本地GPU推理llama、一切在本地保护隐私的人, 有一个算一个,都是大傻逼。 跟去医院插尿管不愿意脱裤子让女护士碰私处的大傻逼一样,愚蠢且可笑。
#Apple intelligence
#隐私安全
#LLM
#AI Agent
#本地AI
分享
评论 0
0
Lao Bai Ⓜ️Ⓜ️T
2周前
这两天x402大火,带火了#Ping,#PayAI 等标的的同时,也唤起了我的一些远古+近期记忆 x402从定义上来讲,是Agent之间基于Crypto的支付协议。从具体场景来说,主要就是Agent之间的微支付/按需支付 殊不知微支付/按需支付这个东西,币圈不是第一次搞,而是第N次了 远古记忆 1. 09-10年 BTC - 中本聪最早在Bitcointalk论坛曾经讨论过微支付的事情,他认为比特币当时的技术限制不适合极小额支付,但将来随着技术的发展有可能实现(毕竟当初他设计BTC的时候是一个Cash System,不是价值存储) 2. 17-18年 闪电网络 - 理论上来说,状态通道这个东西最适合微支付,多小额都可以,且TPS理论上无限,但是一直就是做不起来。 Nano/IOTA - 两个用了有向无环图技术的项目,一个主打日常高性能支付链,一个主打物联网机器之间的支付协议,现在也都化石了 3. 19-20年 BSV - BSV想过把BTC微支付那个概念实现,当时设计了超大区块,0确认,IP直塞能各种Fancy的技术,也确实有视频流支付项目基于其做出来了(看付费视频看到哪支付到哪,边看边支付),但这个场景其实对我们人类来说相对鸡肋 近期记忆 23年6月,ABCDE团队在巴厘岛聚会,当时正值一级市场AI项目被GPT火爆带的井喷。记得Party前在泳池边跟当天最后一个国内的AI项目视频聊完,当时有段对话让我印象极其深刻 - “区块链或者说智能合约这个东西发明出来,其本质不是给人用的,而是给AI用的” 最终这个项目没投,2年多过去不知道他们发展的怎样,希望有在继续坚持。但当时确实ABCDE团队非常Buy In这个Theory,后来24年我们投了一个AI项目,很大程度上也是看中项目对Agent 2 Agent支付这个赛道的理解以及Road Map上对这个赛道的切入 这一切都发生在x402诞生之前,属于混沌期。现在有了x402,加上最近Ping 和 PayAI的爆火,Agent Payfi甚至未来AI时代的支付蓝图终于变得明朗和清晰起来 所以有时候东西做的太早,容易成为先烈而不是先锋。微支付/按需支付这个领域,多年探索,无数失败后终于发现,原来不是场景不对,而是主体不对。人与人之间是不需要微支付的,机器与机器,或者说Agent与Agent之间才是它真正大施拳脚的舞台。 这也许就是大家常说的 - 快人一步吃肉,快人十步吃屎
币圈“1011”六倍崩盘:高杠杆爆仓潮,谁在裸泳?· 6044 条信息
#x402
#Agent Payfi
#微支付/按需支付
#AI Agent
#区块链
分享
评论 0
0
meng shao
2周前
今天看到这个「Benchmark Prompts」开源数据集,是用来测试 AI Agent 前端真实任务表现的。 数据集有 200+ 真实前端任务,包含各种 Figma 设计和文本指令,覆盖不同前端技术栈(如 React/Next.js、组件库、CSS 框架),聚焦复杂、非基准式任务。从编译成功率、代码审查通过率和功能实现率三个方面判定。 测试结果 Kombai 这个前端 AI Agent 表现整体都不错,特别是在 Figma 设计视觉保真和特征实现方面,继续深挖它能做到的原因,它的 Figma interpretation engine 在 ProductHunt 发布中有更多信息披露,当时还拿到了 Day/Week/Month 榜首: 技术基础:集成模型与无预处理 · 集成模型:深度学习 + 启发式子模型,针对布局/元素/样式子任务训练于专属数据集(真实 UI + HTML 映射),推导隐式推理(如层级功能性) · 无预处理:经 Figma API 直接读取矢量数据,精确捕获属性(颜色、阴影、字体),适用于 Dribbble 等平台文件,避免图像检测低精度 关键能力:鲁棒解读与生成 · 设计解读:自动校正非理想模式(如重叠节点、隐形元素、意外阴影) · 资产生成:提取 SVG/图标,输出逻辑 DOM、React 组件、无硬编码 CSS(Flex 等),含功能逻辑 + 视觉预览,支持 IDE 集成。 · 上下文适配:融合代码库(组件/主题),匹配 React/Next.js 等栈,降低集成风险。
#AI Agent
#Benchmark Prompts
#前端任务
#Figma
#Kombai
分享
评论 0
0
Haotian | CryptoInsight
2周前
三十年前,加州尔湾大学的实验室里,Roy Fielding 在 HTTP 协议中埋下了402 状态码这个孤独的彩蛋,期待着一个“按需付费”的互联网未来。 依照他的设想,用户可以为一篇文章付几分钱,为一张图片付几美分,支付会像“ TCP/IP ”握手一样自然地发生在后台。 但在那个互联网狂飙突进年代,这种设想却注定无处生根: 高昂的交易成本让微支付沦为笑话,割裂的用户体验让每次付费都备受折磨,空白的技术基础让这一切只能停留在纸面.....当然,最关键的是,互联网高速增长的20年,“免费”才是主旋律。 于是,Roy Fielding当初那个浪漫的设想被压垮了,HTTP 402 也沉睡了三十年,像一段被遗忘的注脚。 然而,三十年后,“互联网、AI、区块链、MEME”在某个拐角处神奇地相遇了,并产生了不可思议的化学反应。 -AI Agent带来了原子化消费范式,它不需要订阅,不需要广告,只需要 xxxx美元的每一次API调用; -区块链饱和的infra提供了即时结算能力,它让毫秒级的微支付、高频、低成本交易具备了可行性; -MEME给出了爆炸性的病毒传播,让人人如饥似渴般学习x402技术及背后的生态; 重点来了! x402 协议正好把这四股力量拧成了一股绳。把互联网需求和区块链infra能力原本两个平行的世界,焊接到了一起! 这不仅改变了传统的复杂支付范式,还迎合了稳定币大潮下,传统金融和加密资产汇流的大趋势。 想想看,当支付不再需要跳转和确认,当区块链成为互联网协议层原生能力的一部分,当 AI Agent可以像呼吸一样完成千万笔微支付。最关键的是,AI LLMs的到处猎取数据,即将彻底破坏传统互联网的“广告”商业模式。 需要发起一场“按需付费”革命! So,这种种因素叠加下,Roy Fielding那个三十年前被雪藏的“付费”梦想,终于可以搬上台桌重生了。 HTTP 402,那个孤独了三十年的状态码,也终于等来了属于它的x402时代。
#互联网
#HTTP 402
#按需付费
#区块链
#AI Agent
分享
评论 0
0
AB Kuai.Dong
2周前
x402 火之前:中心化的实验品,过度依赖大公司的背书,当年被深套的那帮 AI agent 参与者的自救,发起者 Coinbase 真是没活整了。 x402 火之后:革命性的技术,划时代的发明,整合了所有 AI 支付方式,堪比当年的微信支付诞生时刻,Coinbase 这个光头老板,一看就聪明!PING 还能涨。
币圈“1011”六倍崩盘:高杠杆爆仓潮,谁在裸泳?· 6044 条信息
#x402
#Coinbase
#AI Agent
#微信支付
#光头老板
分享
评论 0
0
Lao Bai Ⓜ️Ⓜ️T
2周前
艹,我忽然发现为什么 $PING 牛逼了,昨儿买的时候还没有意识到,买少了…… 对我来说这不是PING= Ordi 这尼玛是我自己1年前预测的三个主线(Payfi,AI Agent,Meme)的三合一交叉融合啊! 去年那会还没有x402, 当时还是 $GOAT ,我写的是 “直到今年Goat的出现, 才真的让我眼前一亮 这不是AI Help Crypto,也不是Crypto Helps AI 这是真正的AI 与Crypto的结合碰撞出来的新东西 AI Agent 发资产 AI Agent ShitPost喊单 AI Agents 组成DAO AI Agents 负责一个基金的操盘和买卖 AI Agents 自己的文化 AI Agents 自己的宗教 这东西Web2 AI做出不来,Web3纯Crypto也无法独立完成 ” 现在想想,币圈这种跟资产跟交易相关的,还是AI Agent发资产,支付,交易才是最能火的,宗教文化喊单什么的都是配角 PING是Payfi,因为他是X402支付协议相关 PING是AI Agent,因为X402是关于Agent之间的支付协议 PING是Meme,因为它就是个类似Ordi的Meme啊,木有Utility 自己预测的赛道集大成之代币,自己就买了个蚂蚁仓,吐血ing…… 不过不影响我焊跳一个预言家装个X🤣
币圈“1011”六倍崩盘:高杠杆爆仓潮,谁在裸泳?· 6044 条信息
#Ping
#PayFi
#AI Agent
#meme
#x402支付协议
分享
评论 0
0
宝玉
3周前
像 Claude Code、Codex 这样的“AI Coding Agent”,能交付高质量代码,这已经不是新鲜事,但这给软件开发带来的真正改变是什么呢? 硅谷顶尖风投 a16z 最近发了一篇文章:《价值万亿的 AI 软件开发新“战局”(The Trillion Dollar AI Software Development Stack)》,文章的重点不是 AI 会不会写代码,也不是它会不会抢走程序员的饭碗。真正的重点是,AI 正在把“软件开发”这件事,从一个“手艺活”彻底重塑为一个全新的、价值万亿美金的“工业体系”。 为什么是“万亿美金”?我们来算一笔账。 全球大概有 3000 万名软件开发者。假设每人每年创造 10 万美金的经济价值(这在美国算保守了),那整个软件开发业的经济贡献就是 3 万亿美金。 去年的时候,像 Copilot 这样的 AI 助手,就已经能给程序员带来大概 20% 的效率提升。 但这只是开胃菜。a16z 估计,一套“顶配”的 AI 开发系统,至少能让开发效率翻倍。这意味着什么?这意味着每年能凭空多创造出 3 万亿美金的价值。这是个什么概念?这相当于法国全年的 GDP。 这就是为什么资本会如此疯狂,为什么这个领域被称为“战国时代”。 那么,这个价值万亿的“新工业体系”到底长什么样?a16z 给出的这张流程图(图1 )就是答案。 这张图的核心,不再是“人去写代码”,而是 AI 全面参与的“计划 -> 编码 -> 审查”新循环。 第一步:AI 帮你“想清楚”(计划与架构) 过去,我们以为 AI 编程是这样的:你对它说“给我写个登录函数”,它给你一段代码,你复制粘贴。 在新的工作流里,AI 从项目最最开始的“产品经理(PM)”和“架构师”阶段就介入了。 你给 AI 一个模糊的需求(比如“我想做个用户反馈系统”),AI 的第一反应不是写代码,而是反过来向你提问: - “用户反馈需要打分吗?” - “需要上传图片吗?” - “数据要存在哪里?” - “需要和哪些系统打通?API 密钥是什么?” 它会帮你把一个模糊的想法,拆解成一份详细的规格说明书(Spec)。这份说明书既是给人类看的,也是后续 AI 自己写代码的指南。 最有意思的是,我们开始为 AI 编写“AI 专属的说明书”(比如 .cursor/rules、Agents .md、Claude .md)。什么意思?就是你告诉 AI:“我们公司的代码规范是这样的”、“这个模块的安全级别最高,不许调用第三方库”、“日志必须这样打印”…… 我们正在创造第一批纯粹为 AI 而不是为人类设计的知识库。你不再是手把手教一个新员工,你是直接把“公司手册”和“最佳实践”灌输给 AI。 第二步:AI 负责“动手干”(编码与审查) 这才是我们传统理解的“写代码”环节,但它也已经面目全非了。它分化成了好几种模式: - 聊天式编辑:这就像你旁边坐了个结对编程的伙伴,你在 IDE(编程软件)里一边打字聊天,它一边帮你实时修改和创建文件。 - 后台智能体(Agent):Codex Claude、Claude Web 现在已经做的比较成熟了。你给它一个完整的任务(比如“修复这个 bug”或“开发这个新功能”),它就自己去后台吭哧吭哧干活了。它会自己写代码、自己运行测试、自己改 bug,几个小时后,它直接给你提交一个“Pull Request”(代码合并请求),说:“老板,活干完了,请审阅。” - AI 应用构建器:你用大白话描述,或者画个草图,它直接“duang”一下给你生成一个功能完整的应用程序。目前这主要用于做原型设计,但离“直接上线”也不远了。 - AI 代码审查员:AI 不仅自己写代码,它还反过来审查人类写的代码。它会像个资深架构师一样,在 GitHub 上评论:“你这里写得有安全漏洞”、“这个逻辑不严谨”、“不符合公司规范,打回重写”。 这里有个特别有意思的改变:Git(版本控制系统)的意义变了。 以前,我们用 Git 关心的是“代码如何被修改”(比如“张三在第 10 行加了个 if”)。但如果整个文件都是 AI 一键生成的,这个“如何”就没意义了。未来我们关心的是“代码为什么被修改”(AI 是根据哪个提示词生成的?)以及“它能跑吗”(AI 的测试结果如何?)。 第三步:AI 成为“后勤保障”(QA 与文档) 代码写完,测试和文档这两件苦差事,AI 也全包了。 - AI QA(质量保证):AI 扮演一个“自主的 QA 工程师”。它会像真人一样去“爬”你的应用,点一点这个、试一试那个,自动生成测试用例、报告 bug,甚至还附上建议的修复代码。a16z 提到一个极端情况:未来,AI 写的代码可能成为一个“黑盒”,人类根本看不懂,但这没关系,只要 AI QA 说它能通过所有测试,那它就是对的。 - AI 写文档:无论是给用户看的产品说明书、给其他程序员看的 API 文档,还是给老板和法务看的合规性报告,AI 都能自动生成,而且保持实时更新。 第四步:给 AI 的“工具箱”(智能体工具) 这可能是最“硬核”的一层,也是很多人没想到的:我们不止在开发“给人类用的 AI 工具”,我们还在开发“给 AI 用的 AI 工具”。 AI Agent 要是想干活,它也需要“工具”: - 代码搜索引擎(Sourcegraph):一个公司动辄上亿行代码,AI 不可能每次都把所有代码读一遍。它需要一个“代码专用搜索引擎”,在 0.1 秒内找到它需要参考的几个关键函数。 - 文档检索引擎:同理,AI 需要“外挂知识库”来查询第三方 API 怎么用。 - 代码沙箱(E2B):这是最关键的。AI 写完代码总得跑跑试试吧?但你敢让它在你的电脑上“瞎跑”吗?万一它产生幻觉,rm -rf / 把你电脑删光了怎么办?“沙箱”就是给 AI 提供的一个安全的、隔离的“模拟器”,让 AI 可以在里面随便折腾、运行、测试,就算玩“炸”了,也不会影响真实环境。 a16z 在文章最后也回答了几个大家最关心的问题: 1. 3000 万程序员要失业了吗? a16z 的回答是:“当然不。” 他们认为“AI 取代程序员”是个“荒谬的叙事”。历史告诉我们,技术进步最终会把蛋糕做大。目前他们看到的真实数据是:那些最懂 AI 的企业,反而在加速招聘程序员。因为他们突然发现,以前要 100 人年才能做的项目,现在 10 个人就能启动了,那为什么不多开几个项目呢? 2. 那程序员的工作会变吗? 会,而且是巨变。 大学里教的那些传统“软件开发”课程,可以说一夜之间就成了“老古董”。 但有两样东西不会过时:算法和架构。因为 AI 经常会“挖坑把自己埋了”,你需要有扎实的基本功,才能把它从坑里“拽出来”。你的角色,从“砌墙的工人”变成了“指挥挖掘机和吊车的工头”。 3. 代码最终会消失吗? 也不会。 有人(比如 AI 大神 Andrej Karpathy)畅想,未来不需要代码了,LLM 直接执行我们的“意图”就行。 a16z 认为这不现实。为什么?因为代码的效率高到变态。 一个现代 GPU 执行一次 16 位整数加法,需要 10 的-14 次方秒。而一个 LLM 哪怕只生成一个 token(单词),也需要 10 的-3 次方秒。 两者之间是 1000 亿倍的效率差距。 所以,代码作为“意图”的最高效、最精确的“编译结果”,在很长很长时间内,都是不可替代的。 AI 对软件开发的革命,不是“工具革命”,而是“工业革命”。它不是在造一把“更好的锤子”,它是在造一整条“自动化生产线”,而且这条生产线还需要“给生产线用的工具”。 这是一个“技术超级周期”(technology supercycle)的开端。在这样的浪潮中,旧的霸主(比如微软、Meta)会很难受,因为船太大、掉头慢。而新的创业公司有绝佳的机会,因为整个游戏规则都变了。 对于我们每个从业者和爱好者来说,最好的消息是:一个充满无限可能的新大陆刚刚被发现,而我们正站在滩头阵地上。 原文地址: 翻译:
Claude Skills系统发布引发AI行业新变革· 46 条信息
#AI软件开发
#AI编程革命
#万亿美金市场
#软件开发工业体系
#AI Agent
分享
评论 0
0
dontbesilent
3周前
这几天有三个广告找过来,主打的方向一模一样 即梦 美图设计室 小云雀,都是主打双十一之前曝光,让用户可以一键出电商设计图 这是现在国内所谓 “AI Agent” 的增长卖点
#AI Agent
#电商设计
#双十一
#广告
#一键出图
分享
评论 0
0
迈克 Mike Chong
3周前
ChatGPT 的 AI 浏览器大概是怎么实现的? AI Agent 浏览器并不是“火箭科学”(rocket science),简单给大家一个小小的分享让大家了解背后的原理,可以更好使用起来。
#ChatGPT
#AI浏览器
#AI Agent
#技术原理
#经验分享
分享
评论 0
0
howie.serious
3周前
有请 howieserious.agent, 使用 `feynman-pro` skill,介绍一下上周五晚上的2小时 agent主题直播:🤣 很多人付了200美元买AI会员,一个月后发现只用了2美元,剩余99%。这不是使用频率的问题,而是使用方式已经落后了两年。 真正的问题不在于你是否在用AI,而在于你还在用什么方式用AI。2023年的Chat模式和2025年的Agent模式,差距就像用算盘和用计算机的差距。你问一句,它答一句,看起来很智能,实际上你根本没有释放出这个工具的真正能力。当你还在对话框里聊天时,有人已经让AI连续工作30个小时,翻译完65本书,或者处理完一整年的投资研究。 这背后的本质差异在于:Chat是在"预测下一个token",而Agent是在"完成一个目标"。前者被困在浏览器窗口里,只能陪你聊天;后者被释放到你的工作环境中,能够制定计划、调用工具、主动行动、反思调整,形成一个完整的循环,直到把事情做完。就像人类员工一样,你给他一个目标,他就会想办法完成,而不是等你一句一句地指挥。 更关键的是,决定Agent产出质量的不是什么玄学的Prompt Engineering技巧,而是一个简单的乘法公式:你对领域的洞察 × 你提供的上下文 × 你使用的模型。这三个要素任何一个为零,产出就是零。很多人在网上找各种"神奇prompt",期待copy进去就能神奇地产出高质量结果,这是一种不靠谱的玄学期待。真正起作用的,是你把自己的专业理解、工作经验、知识积累转化成结构化的prompt和高质量的context。 有人用同样的方式做外文信息流翻译订阅,年收入上千万。有人把心理咨询、投资研究、内容创作这些过去需要大量人力的脑力劳动,用100美元的token成本替代了过去3万元的人工成本。他们的秘密不是掌握了什么高深技巧,而是理解了一个简单的事实:过去人脑做的很多计算,现在完全可以转移到GPU上去做,而且做得更好、更快、更便宜。 这就是为什么TOKEN消耗量会成为新的衡量指标。一个月消耗500万个短视频和消耗500万个高质量reasoning token,产出的价值完全不在一个量级。Agent范式的核心不是让你更忙,而是让你用更少的脑力,做更多更好的事。你的有限认知应该用在更高级、更有创造性的地方,而那些有章法、有流程的工作,完全可以交给你设计好的Agent去完成。 真正的转折点是:当你理解了"你是如何工作的",你就能设计出"你的Agent"。把你的工作流程、专业洞察、知识积累梳理清楚,转化成Agent的skills和context,你就相当于复制了一个你自己。不是替代你,而是让你从重复性的脑力劳动中解放出来,去开拓新的边界,探索更深的洞察,变得更智慧、更从容。 2025年不要再用2023年的方式使用AI。这不是工具的升级,而是工作范式的革命。 ---- 下面,是同一个agent,使用`note-taking-pro`skill 产出的5000字大纲笔记。有需要的可以看看
#AI Agent
#工作范式革命
#token消耗量
#解放脑力
#领域洞察
分享
评论 0
0
Y11
3周前
最近接触AI时,我常被“Agent”和“Assistant”这两个词绕进去。 后来想明白了,这就像我们身边的两种工具:一种是“助手”,一种是“能自己干活的智能体”。 先说说Assistant,它更像我们日常用的语音助手,比如手机里的Siri、小爱同学。 你问它“今天天气怎么样”,它就直接回答;你说“设置个明天早上8点的闹钟”,它就照做。这种工具的核心是“被动响应”——必须等你发出明确指令,它才会行动,而且做的事情都是提前设定好的,不会自己“多想一步”。 就像一个熟练的助理,你把任务写清楚,它就按流程完成,不会主动改变计划。 而Agent就不一样了。它更像一个“能自己规划的小团队”。比如你让它“帮我买一杯咖啡”,它不会直接打开外卖软件下单,而是会先拆解问题:需要确定附近有哪些咖啡店、哪家有优惠、当前配送时间够不够、钱够不够付……然后一步步调用工具去实现。它有自己的“思考能力”,能根据实际情况调整策略,甚至在遇到突发问题时(比如某家店突然关门),还能临时换一家。这种自主性让它能处理更复杂的事情,就像一个有经验的项目负责人,能把大目标拆成小步骤,自己推进完成。 我总结了一下两者的关键区别:Assistant是“执行者”,Agent是“决策者+执行者”。打个比方,对安全团队来说(这是我最近关注的领域),P5级别的安全工程师可能就像Assistant,需要别人明确告诉他“检查服务器漏洞”“处理某个安全事件”,他才动手;而P6级别的工程师就开始接近Agent了,能自己拆解问题,比如从“防范勒索病毒”这个大目标,分解出“加固终端防护”“检查备份策略”“培训员工安全意识”等多个小任务,并且能根据实际情况调整优先级。 再往远想,2023年AI技术已经给智能体装上了“大脑”(推理能力)、“眼睛”(视觉识别)、“耳朵”(语音处理)和“记忆力”(数据存储)。2024年,大家可能会看到它们长出“身体”——也就是“具身能力”,比如能自己操作设备、在真实环境中移动。 至于更高级的P7级安全工程师,可能需要智能体具备“自我进化”能力:比如自己发现工作流程中的漏洞,主动优化方法,甚至在没有人工指导的情况下,通过学习新的攻击手段来提升防护能力。这种能力现在看还比较遥远,但技术发展的速度,说不定哪天就实现了。 说到底,理解这两个概念,其实是在看AI从“被动服务”到“主动创造”的进化。就像从用计算器到用能自己解题的数学软件,区别不在于“算得快”,而在于“能不能自己搞懂怎么算”。
#AI Agent
#AI assistant
#智能体
#自主决策
#安全工程师
分享
评论 0
0
AI进化论-花生
3周前
前天分享了我用Claude Code写作的工作流,但实际上Claude Code已经不只是AI编程和AI写作的工具了,我完全是把它当成通用的agent去用,80%以上用到AI的任务都是通过Claude Code完成的了。 比如说,我昨天还让它帮我做了A股、美股等不同股票市场最近15年每天指数变化数据的收集,还做了一些策略的回测分析;晚上又拿它来给我下载B站博主的视频字幕文件,帮我学习和借鉴他们的内容创作结构。 然后,当你期望cc帮你完成的任务越来越多,你在不同的任务上有不同的要求,又频繁需要切换的时候。 这里涉及到一个挺重要的问题是:你需要给cc规则,但...你又不能一次性给太多规则,否则影响任务表现、影响指令遵从情况,上下文也很容易爆掉。 所以,我这里分享一个我的经验,就是建一个路由机制,在你和cc对话的文件夹根目录中用去写这套任务机制,同时,又在每个子文件的目录下分别写上对应任务的,并且要在平时用的过程中,频繁地让cc去更新规则。 这种情况下,既可以让你每次在固定的路径下打开cc,同时又解决各种潜在问题,我自己的感受是比用subagent还好用,也有点像anthropic昨天刚提出的skills的概念,但这种方式的自主性和可调节性会更强一些。
Claude Skills系统发布引发AI行业新变革· 46 条信息
#Claude Code
#AI Agent
#股票市场数据
#B站视频字幕
#路由机制
分享
评论 0
0
YL (Yucheng Liu)
4周前
运营 X BoostClub 这样的 KOC 平台,最耗费心力的工作就是扮演“传话人”的角色。真正的壁垒在于系统化:如何用 AI Agent 自动化审核流程、评估内容质量、避免“劣币驱逐良币”?我们正在复盘所有商单,准备开个免费分享课,聊聊如何成为一个合格的、能持续接到单的商单创作者。感兴趣吗?
#KOC平台
#AI Agent
#商单创作者
#内容质量
#免费分享课
分享
评论 0
0
凡人小北
4周前
突然 FDE(Foward Deployed Engineer 前沿部署工程师)这个词火得有点莫名其妙,很多创业者一夜之间开始膜拜 Palantir 式打法,搞得好像硅谷又发现了什么新大陆。 先说我的看法:国外现在兴奋讨论的这套东西,中国人早就在用了。不夸张地说,FDE 这个概念在国内 toB 创业环境里,根本不是什么未来范式,它是过去 10 年我们活下去的方式。 硅谷的 FDE 模式今天之所以被捧上神坛,是因为 AI agent 产品天然不能标准化、不能纯靠 SaaS 拉起规模,只能靠“深扎现场 + 产品抽象 + 高难度交付”(这几个词眼熟吗)这种非线性方式打通从 0 到 1 的路径。 这种新范式我们不叫 FDE,我们叫它: 售前 + 客户经理 + 实施 + 技术支持 + 专人陪跑 + 项目现场 + 临时产品经理 是不是听上去不那么高级,也没人总结成Echo + Delta 团队这样的理论模型可中国 to B 创业者、尤其是医疗、制造、政企、教育领域的创业者,从来没有什么 SaaS 福报。 我们走进客户现场,用工程师替客户解决一线需求,项目经理拆用例,售前写方案,然后陪标、上系统。这些人一开始就被扔进落地即交付,交付即定制的泥沼里,硬生生走出了一套非标准化探索到产品复用化的路径。 所有这些国外今天才开始鼓吹用 demo 去找 PMF,我们已经 demo 到脱发了。欧美 SaaS 怕是忘了东方还有个神奇的国度。 为什么现在大家把 FDE 当作一种新的 go-to-market 策略来膜拜。可能是因为他们原来做的是标准化 SaaS,突然卷进 AI agent 的复杂场景,一下子手脚不够用了,才发现:哦原来世界上还有一种方式,叫“没有产品也要先干起来”?
#FDE
#toB创业
#中国经验
#AI Agent
#非标准化
分享
评论 0
0
steven
4周前
想转行的朋友注意了! 最近最火的方向——AI Agent,机会非常大。 我给大家整理了一份干货资料,建议先收藏、慢慢学。 第一阶段:基础概念入门 适合人群:完全初学者,对 AI Agent 概念不熟悉 推荐课程: 1. 微软 AI Agents for Beginners 课程内容:10节课,从概念到代码 学习重点:构建AI代理的基础知识 地址: 建议学习时间:1-2周 第二阶段:核心技术掌握 适合人群:有一定编程基础,希望深入理解技术原理 推荐课程: 1. 吴恩达 Agentic AI 课程 课程内容:构建智能工作流 学习重点:代理式AI的实际应用 建议学习时间:2-3周 2. Hugging Face AI Agents 课程 课程内容:从新手到专家的全面技能 学习重点:实用的AI智能体开发技能 地址: 特色:免费课程,含认证与挑战赛 建议学习时间:3-4周 第三阶段:企业级实战应用 适合人群:有一定经验,希望在实际项目中应用 AI Agent 推荐课程: 1. Google 5天 AI Agent 培训课 课程内容:企业级AI Agent开发 学习重点:实战项目经验 地址: 建议学习时间:1周集中训练 2. Anthropic 官方课程 课程内容:Claude AI Agent 开发 学习重点:高级AI Agent技术 地址: 建议学习时间:2-3周 第四阶段:专业化进阶 适合人群:希望深入研究特定领域的开发者 推荐课程: 1. Coursera AI Agents 专项课程 课程内容:系统化的AI Agent知识体系 学习重点:学术理论与实际应用结合 地址: 建议学习时间:2-3个月 2. Salesforce AI Agent Course 课程内容:商业应用场景 学习重点:企业级AI Agent解决方案 地址: 建议学习时间:4-6周
#AI Agent
#职业发展
#在线课程
#技能提升
#干货资料
分享
评论 0
0
凡人小北
1个月前
《为什么 95% 的 AI Agent 做不起来?》 非常推荐,踩的坑和解决方案跟我们几乎一模一样,虽然讲得很清楚,架构师视角,值得花 10 分钟读完,应用到工程实践中。 几个点: 1. 现在大家都还在拼 prompt,只有少数人开始拼上下文结构。 特别对的一点是:prompt engineering 已经不是核心了,context engineering 才是下一阶段的主战场。给再聪明的大模型喂进去一堆乱七八糟的输入,它还是只会胡说八道。 市面上跑得稳的 Agent,都是在“什么该让模型看、怎么看、以什么形式看”上下了大功夫的,这一点现在应该是共识了。 2. 记忆系统这事,光是能存起来远远不够 很多公司的 memory,说得好听点是长期记忆,难听点就是个聊天记录仓库。 真正落地的系统要分层记忆(用户级 / 团队级 / 系统级)。文章读完我感觉更多的篇 B 端,C 端要思考的是结合业务来做分层记忆,并且要能让人知道 它记住了什么,并且用户能自己改。否则就不是记忆是监控。 3. 不迷信单模型,这年头还不做 routing 的 agent 就别说自己做 infra 了。 这篇文章提到多模型路由,说得很对。不可能所有请求都丢给 GPT5,成本和时延直接炸掉,表现也未必好。 真正合理的系统,一定是: 快速反应的轻模型做分类和前处理、重模型做主任务、补一个模型做验证或追问。 一个 agent 后面绑定的一定是一个 LLM 团队。 4. 可追溯/可控/可信,是企业愿意用 Agent 的底线 很多人只想着怎么让 agent 能回答,但企业更关心:这句话是从哪里来的?有没有越权?出了错我怎么追责? AI 要可治理。 5. 最被低估的一点:Agent ≠ Chatbot 这篇文章最后说到的一点我非常赞同但还不够狠:如果还在用聊天当所有用户交互的方式,那agent 最多是个语音助理。 真的 agent 应该是:先用语言调度任务,然后在页面上看到结构化结果,还能继续点选、调整、组合下一步。这部分很多公司现在在尝试了,交互上比之前全部自然语言高效了太多。 一个特别有意思的点,当主持人问观众“你们中有多少人构建了文本到 SQL 并投入生产?”时,没有一个人举手。
#AI Agent
#Context Engineering
#多模型路由
#可追溯性
#人机交互
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞